频繁且与结构相关的子图(也称为网络基序)是许多图形数据集的宝贵特征。但是,在任意数据集中识别主题集的高计算复杂性(主题挖掘)限制了它们在许多现实世界数据集中的使用。通过自动利用数据集的统计属性,机器学习方法在具有组合复杂性的几个任务中显示出了希望,因此是网络基序挖掘的有前途的候选人。在这项工作中,我们试图促进针对图案采矿的机器学习方法的开发。我们建议将基序挖掘问题作为节点标记任务进行公式。此外,我们构建了基准数据集和评估指标,这些指标测试了模型捕获主题发现不同方面的能力,例如主题数,大小,拓扑和稀缺性。接下来,我们提出了Motifiesta,这是第一次以完全可区分的方式解决此问题的尝试,并在具有挑战性的基准方面有希望的结果。最后,我们通过Motifiesta证明,该学习设置可以同时应用于通用数据挖掘和用于图形分类任务的可解释功能提取。
translated by 谷歌翻译